کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره

Authors

Abstract:

تشخیص داده‌های خارج از ردیف چند متغیره به کمک الگوریتم‌های داده‌کاوی یکی از نکات ضروری پیش‌پردازش داده‌های اکتشافات ژئوشیمیایی محسوب می‌شود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روش‌های آماری، روش‌های مبتنی بر مجاورت، روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر دسته‌بندی هستند، معرفی شده و کاربرد آنها بر روی داده‌های ژئوشیمیایی ورقه 100000/1 روم با ماتریس داده 41×902 بررسی شده است. برای این منظور ابتدا روش ilr برای باز کردن سیستم عددی داده‌ها بکار رفته و سپس داده‌ها در بازه صفر تا یک استاندارد شده است. نتایج پیاده شده چهار الگوریتم فوق بر روی مجموعه داده‌های استاندارد شده، نشان می‌دهد که در رویکرد تشخیص نمونه‌های دارای خطا، 10 نمونه که دارای بالاترین احتمال خارج از ردیف بودن هستند و در هر چهار الگوریتم نیز یکسان می‌باشند را می‌توان برای بررسی بیشتر به عنوان نمونه‌های انتخابی برای نمونه‌برداری تکراری در نظر گرفت. در رویکرد تشخیص نمونه‌های غیر نرمال، از 150 نمونه‌ی انتخابی 5/74% از نمونه‌ها در هر چهار الگوریتم و 1/16% و 4/9% نیز به ترتیب در یک و دو الگوریتم به عنوان داده‌ی خارج از ردیف شناسایی شده است. مقایسه نتایج الگوریتم‌های انتخابی با روش کلاسیک فاصله ماهالانوبیتس نشان دهنده‌ی برتری آنها در هر دو رویکرد است. همچنین پیشنهادی می‌شود از الگوریتم‌های تشخیص داده‌های خارج از ردیف چند متغیره می‌توان برای تعیین نمونه-برداری‌های تکراری، محاسبه ماتریس موقعیت و پراکندگی در آمار چند متغیره مقاوم پس از حذف داده‌های غیر نرمال و تعیین آنومالی‌های ژئوشیمیایی استفاده کرد.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

جداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای

داده‌های پرت در ژئوشیمی اکتشافی بسیار مهم هستند و می‌توانند اثرات زیادی بر نتایج روش‌های آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل داده‌های ژئوشیمیایی، تشخیص و تصمیم‌گیری در مورد حذف یا تصحیح آن‌ها است. این داده‌ها را به 3 روش تک متغیره، دو متغیره و چند متغیره می‌توان شناسایی کرد که هدف از این تحقیق جداسازی آن‌ها با استفاده از روش‌های تک...

full text

آنالیز داده های ژل های الکتروفورز دو بعدی با استفاده از روش های آماری چند متغیره

سابقه و هدف : در سـال های اخیـر تکنولـوژی مـربوط به تـوصــیف لکه های پروتئینی نمایان شده بر ژل های الکتروفورز دو بعدی، توسعه ی قابل ملاحظه ای یافته و نرم افزارهای متعدد آماری آنالیز ژل نیز ایجاد و گسترش یافته است که تأثیر این ابتکارات بر ارتقاء پروتئومیک بسیار چشمگیر است.آنالیز داده های عظیم پروتئومیکی با دارا بودن متغیر های زیاد نیاز به روش های چند متغیره است که امکان آنالیز آماری همزمان چندین...

full text

داده کاوی و کاربرد آن در تصمیم‌گیری‌ها

ابهامات محیطی ناشی از مدل‌های نوین کسب و کار سبب تشدید پیچیدگی در تصمیم‌گیری، به‌ویژه در حوزه کسب و کار شده است. به‌طوری‌که بسیاری از متغیر‌های تاثیرگذار ناشناخته بوده و روابط میان آن‌ها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمی‌توان داده‌ها را با ابزارهای سنتی تحلیل نموده و از آن‌ها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...

full text

جداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای

داده­های پرت در ژئوشیمی اکتشافی بسیار مهم هستند و می­توانند اثرات زیادی بر نتایج روش­های آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل داده­های ژئوشیمیایی، تشخیص و تصمیم­گیری در مورد حذف یا تصحیح آن­ها است. این داده­ها را به 3 روش تک متغیره، دو متغیره و چند متغیره می­توان شناسایی کرد که هدف از این تحقیق جداسازی آن­ها با استفاده از روش­های تک...

full text

استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون

مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش‌ های داده‌ کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 14  issue 45

pages  63- 82

publication date 2020-02-20

By following a journal you will be notified via email when a new issue of this journal is published.

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023